Sesión 1: Inferencia causal en ciencias sociales

Magíster en Métodos para la Investigación Social 2024

Autor/a

José Conejeros

Fecha de publicación

lunes 04 de noviembre, 2024

Facultad de Ciencias Sociales e Historia UDP
Click al repositorio

¿Qué es la inferencia causal?

Podemos entender la inferencia causal como el interés por estimar el efecto de los acontencimientos y las decisiones sobre un resultado de interés determinado.

Algunos ejemplos:

Zubizarreta, J. R., Cerdá, M., & Rosenbaum, P. R. (2013). Effect of the 2010 Chilean earthquake on posttraumatic stress: reducing sensitivity to unmeasured bias through study design. Epidemiology, 24(1), 79-87.

Torche, F. (2011). The effect of maternal stress on birth outcomes: exploiting a natural experiment. Demography, 48, 1473-1491.

Muralidharan, K., Singh, A., & Ganimian, A. J. (2019). Disrupting education? Experimental evidence on technology-aided instruction in India. American Economic Review, 109(4), 1426-1460.

Fundamental

  • Datos: ¿Cuál es la estrategia de identificación?

  • Supuestos: ¿Cuáles son los supuestos que sustentan la causalidad en un estudio?

Sin embargo, tendremos algunos inconvenientes…

Problema fundamental de la inferencia causal

Considere una población de \(i\) unidades potencialmente expuestas a un tratamiento (causa) o control. La variable \(D_i\) nos indicará si la unidad \(i\) fue tratada (\(D_i=t\)) o no tratada, o sea control, (\(D_i=c\)).

Nos interesa evaluar el efecto sobre una variable de respuesta observada que denotaremos como \(Y_i\) con dos respuestas potenciales:

  • \(Y_i(t)\) si la unidad fue tratada
  • \(Y_i(c)\) en caso contrario

Dado que \(Y_i\) mide el efecto de la causa, entonces, los valores de \(Y_i\) son posteriores a la exposición del tratamiento.

A su vez, denotamos que el modelo causal del tratamiento en una unidad \(i\) puede ser expresado como:

\[\delta_i=Y_i(t)-Y_i(c)\]

Lo interesante del modelo Neyman-Rubin es que el valor de \(D_i\) para cada unidad \(i\) podría haber sido distinto. Este es el problema.

\[Y_i=D_iY_i(t)-(1-D_i)Y_i(c)\] Donde \(D_i=1\) si la persona fue tratada y \(D_i=0\) en caso contrario, entonces:

\[\delta_i=(1)Y_i(t)-(1-0)Y_i(c)=Y_i(t)-Y_i(c)\]

Problema fundamental de la inferencia causal

La imposibilidad de observar una variable de respuesta \(Y_i\) en la misma unidad y al mismo tiempo para dos condiciones diferentes: \(Y_i(t)\) y \(Y_i(c)\).

Graficamente:

Este es problema de missing data para los tratados solo conocemos \(Y_i(t)\) y para los controles solo conocemos \(Y_i(c)\).

¿Qué se puede hacer?

Average Treatment Effect (ATE)

Podemos usar la población \(U\) mediante un efecto causal promedio (ATE) como el valor esperado de la diferencia \(Y_i(t)-Y_i(c)\) en los \(i\)’s de \(U\):

\[ \begin{align} ATE & = E[\delta_i] \nonumber \\ & = E[Y_i(t) - Y_i(t)] \nonumber \\ & = E[Y_i(t)] - E[Y_i(c)] \end{align} \] Adaptado de Broockman, D. E., Kalla, J. L., & Sekhon, J. S. (2017). The design of field experiments with survey outcomes: A framework for selecting more efficient, robust, and ethical designs. Political Analysis, 25(4), 435-464.

Supuestos

Si \(Y_{i}(D_i)\) es una variable de respuesta observada cuyo valor puede ser \(D_i=1\) para \(Y_{i}(t)\) o \(D_i=0\) para \(Y_{i}(c)\), entonces:

Independencia: la asignación al tratamiento es independiente de la variable resultado para tratados (\(Y_{i}(t)\)) y controles (\(Y_{i}(c)\)), y de cualquier otra variable en la población, formalmente queda expresado de la siguiente manera: \[(Y_{i}(t), Y_{i}(c)) \perp D_{i}\] En otras palabras:

  • \(E[Y_i(t)]=E[Y_i(t)|D_i=1]\)
  • \(E[Y_i(c)]=E[Y_i(c)|D_i=0]\)
  • \(ATE=E[Y_i(1)|D_i=1] - E[Y_i(0)|D_i=0]\)

Los términos son equivalentes e intercambiables:

  • Tratados: \(E[Y_i(1)|D_i=1] = E[Y_i(1)|D_i=0] = E[Y_i(1)]\)
  • Controles: \(E[Y_i(0)|D_i=0] = E[Y_i(0)|D_i=0] = E[Y_i(0)]\)

En consecuencia la asignación al grupo de tratamiento o control no incide sobre el valor esperado. Por lo tanto, la asignación aleatoria es condición de posibilidad de la independencia y se deduce que, en los promedios, la única diferencia entre \((D_{t}\) y \((D_{c}\) corresponde a que un grupo fue tratado y el otro no. En definitiva, se puede estimar el \(ATE\) como el efecto promedio del medicaid para el grupo tratamiento y en el grupo de control:

\[\frac{1}{N}\sum_{i=1}^{N} Y_{i}(t) - \frac{1}{N}\sum_{i=1}^{N} Y_{i}(c)\]

Restricción de exclusión: los resultados del experimento dependen únicamente de la exposición al tratamiento \((D_{i}=1)\) y no de la asignación entre grupo de tratamiento y control. En términos formales nos permite identificar el efecto causal. En definitiva se espera que todos los individuos asignados al tratamiento sean expuestos al estímulo, a su vez, los asignados al grupo de control no son expuestos al estímulo: \[Y_{i}(1,d) = Y_{i}(0,d)\]

Stable-unit-treatment assumption (SUTVA): no hay interferencia (spillovers) en la respuesta al tratamiento de un individuo en comparación a otro. En otras palabras, si la observación \(i\) se expone al tratamiento \(t\), el valor de la variable resultado \(Y\) se mantendrá igual sin importar el tipo de asignación ni el tipo de tratamiento que reciban las otras observaciones \(i\) (sería problemático que la asignación del seguro a un individuo afectara el resultado de salud en otro individuo). Esto nos garantiza de que solo existan dos respuestas ante la condición de tratamiento (asignación), independiente de las otras unidades. Por lo tanto, podemos estimar la causalidad como al diferencia en la variable resultado para el grupo de tratamiento y el grupo de control.

Adaptado de Broockman, D. E., Kalla, J. L., & Sekhon, J. S. (2017). The design of field experiments with survey outcomes: A framework for selecting more efficient, robust, and ethical designs. Political Analysis, 25(4), 435-464.

Algunos ejemplos:

  • Salud pública: efecto rebaño.

  • Educación: estudiantes pueden compartir su conocimiento con amigos.

  • Criminología: la presencia policial puede desplazar la criminalidad a otras áreas.

La idea del contrafactual

Pensemos dos escenarios, ¿podemos identificar el efecto?

  • Comparaciones antes-después: cotejan los resultados del mismo grupo antes y después de una intervención.

  • Comparaciones de participantes versus no participantes: comparan los resultados de un grupo que elige participar de la intervención versus otro grupo que elige no participar.

Correlación vs causalidad

En muchos estudios e investigaciones, es fácil observar una correlación entre dos variables, como la acción del hombre dentro del vehículo y el movimiento de este, pero eso no significa que una variable cause la otra. La causalidad implica un mecanismo claro que conecta las variables de manera que una provoque la otra, como las personas empujando el vehículo desde fuera.

La pregunta de fondo es ¿la correlación observada es causal?

Causalidad \(\neq\) Asociación:

\(E[Y_i(1)] - E[Y_i(0)] \neq E[Y_i(1) | D_i = 1] - E[Y_i(0) | D_i = 0]\)

Dos condiciones necesarias:

  1. \(E[Y_i(1)|D_i=1]=E[Y_i(1)|D_i=0]=E[Y_i(1)]\)
  2. \(E[Y_i(0)|D_i=0]=E[Y_i(0)|D_i=1]=E[Y_i(0)]\)

Si las condiciones 1 y 2 se cumplen entonces: Causalidad \(=\) Asociación:

Pensemos en algunas relaciones:

  • ¿El cinturón de seguridad (X) reduce mortalidad por accidentes (Y)?
  • ¿La contaminación industrial (X) aumenta la temperatura del planeta (Y)?
  • ¿Un mayor nivel educativo del padre (X) aumenta el nivel educativo del hijo?
  • ¿Venir a clases (X) mejora mi nota final (Y)?

El concepto clave para responder estas preguntas sobre causalidad es el de contrafactual o contrafáctico ¿Qué hubiese pasado en ausencia del tratamiento? El escenario ideal es poder comparar el resultado cuando ocurre y cuando no ocurre.

Aproximación al ATE vía regresión lineal